WIPO专利WO1981002489A1 Speech synthesis unit

专利PDF首页>>WIPO专利

专利附录

专利说明

权利要求

类似技术

同族专利

引用文献

法律状态

优先权

专利摘要:

公开号:WO1981002489A1
申请号:PCT/JP1981/000031
申请日:1981-02-17
公开日:1981-09-03
发明作者:K Umemura；H Sato；K Nakata；T Sampei；K Indo；K Murakami
申请人:Nippon Telegraph & Telephone；Hitachi Ltd；K Umemura；H Sato；K Nakata；T Sampei；K Indo；K Murakami；
IPC主号:G10L19-00

专利说明:
[0001] 明細書 .
[0002] 音声合成装置
[0003] 技術分野
[0004] 本発明は音声合成装置に関するもので、詳しくは音声
[0005] 信号の周波数スぺクトル包絡をあらわすパラメータ信号
[0006] と，音声信号の周期をあらわす情報に基ずいて音声を合
[0007] 成する音声合成装置に関するものである。
[0008] 背景技術
[0009] 祙式市場の市況、，天気予報、，各種展示会の案内等の情
[0010] 報を音声で提供する情報サービス通信網においては、各
[0011] 種の情報をデジタル信号で伝送し、これ等通信網の端末
[0012] につながれる端末機において伝送された情報を音声に変' 換して提供できるように音声合成装置を使用することが
[0013] 望まれている。また学習器，自動販売機，会場案内のた
[0014] めの案内放送装置等発声する音声の単語の数が少ないも
[0015] 'のにおいては、従来の磁気記録テ―ブに代えて半導体メ
[0016] モリ一を使用する音声合成装置が使用されつつある。
[0017] 音声信号をデジタル信号に変換して記憶させ、記憶さ
[0018] れたデジタル信号を組合せて音声を合成するデジタル音
[0019] 声合成装置は、連続する音声信号を一定時間間隔とに
[0020] 切り出し、切り出した音声波形からこの ½声の特徵パラ
[0021] メータを抽出し、これをデジタル信号に変換して記憶さ
[0022] せ、音声を合成する場合には記億された音声の特徵パラ
[0023] メータを組合せて合成するものであって、合成音の音声
[0024] 単位を単語以下の単音節にすることができるので記憶装
[0025] .: I
[0026] -vi--o 置の記憶容量を増加させることなく多くの語を合成することができる。また機械的に可動する部分を持たないため摩耗等による故障が発生せず、維持管理が容易になる。
[0027] 従つて音声合成装置としては音声の特徵パラメ一タに基ずいて音声を合成する方法を使用することが維持管理、を容易にし、記憶装置を小容量にすることができるので好ましい。
[0028] 音声のスぺクトル分布の変化は人間の舌や唇などの調音器管の運動に基ずくものであるため、その変化は緩やかであり、 10〜 5 τ^ の短時間区間に着目するとほぼ定常的と見なすことができる。そこでこの定常区間から音声のスぺクトルの特徵を正確に抽出することにより音声の分析することができ、また抽出した情報に基ずいて音声を合成することができる。音'声を分析し合成する場合、音声のスぺクトル分布の変化が定常的と見なすことがで -きる短時間区間の音声スぺクトルカら、このスぺクトルの包絡を表わすパラメータと-，音声信号の提幅を表わすパラメータ，声帯の基本振動周波数に相当するピッチ情報及び有声音か無声音かを判別する判別情報を抽出すればよい。、
[0029] 音声信号から上述の特徵パラメータを抽出し、これに基ずいて音声を合成する音声分析合成方式の 1 つとして、線形予測係数の一種である偏自己相関係数（： Partial AIL to -Corre ation Coefザ icients 後 P A R C 0 R 数と称す）を用いる型の分析合成方法がある。この装置は音声信号の特徵パラメータを係
[0030] 数で表わすもので、音声信号の周波数スぺクトルの変化
[0031] が緩やかで定常的と見られる短時間区間の音声信号を例
[0032] えば ^の標本化周期で標本化し、時系列に表われる.:
[0033] 標本値のうち接近する 2時点の標本値をこの 2時点の間
[0034] に存在する標本値を用いて最小 2乗予測し、予測した値
[0035] と実際の 2時点の標本値とをそれぞれ比較してその差を
[0036] 求め、それぞれの差の値の相関（ P C O Ji係数 ) を求
[0037] めるものである。そして音声合成装置では白色雑音及び
[0038] パルスを発生する信号発生器を音源となし、この音源の
[0039] 出力信号の振幅を前述の C O A係数で制御して出力
[0040] 信号に相関を与え、周波数スぺクトル包絡を再現して音
[0041] 声を合成するものである。
[0042] この型の音声分析合成方法は、音声を分析
[0043] して得られる P i C O 係数，ピッチ情報，振幅情報及
[0044] -び有声，無声の判別情報を全て 2進数で表わすデジタル
[0045] 信号で取扱うことができ、これ等の情報は半導体メモリ —に記憶させることができる。また 2進数で表わされた
[0046] 情報を電話回線を利用して伝送することもできる。
[0047] 音声を分析して音声の特徵パラメータを抽出する場合、上述のように音声を短時間間隔に区切つ' ' 分析を行なう。
[0048] この短時間区間は一般に分析フレームあるいは単にフレームと呼ばれ、この ¹ フレームから C 0 _R係数，ピ
[0049] ツチ情報，振幅情報及び有声無声の判別情報が抽出され
[0050] る。そして 1 フレーム当りの情報は例えば 96ビッ卜の情
[0051] G， ^r. l 報量で転送される。この情報量は ¹ フレームの時間を ²0 ms ec とすると ⁴ δΟΟビット秒の情報量となり、 1 フレ
[0052] 一ムの時間を 10TOj ec とすると 9000 ビット Z秒の情報量
[0053] となる。
[0054] 音声を分析して得た音声パラメータに基ずいて音声を
[0055] 合成する音声合成装置は、合成する際に用いられる情報
[0056] 量によって合成音声の質が決定される。例えば音声分析
[0057] によつて得られた音声パラメータを 4800 ビット /秒の情
[0058] 報量で伝送する場合と、 9000 ビット Z秒の情報量で伝送
[0059] する場合とでは、明らかに 90D0 ビット Z秒の情報量で伝
[0060] 送する方が音質は良い。しかし、たとえばディジタル電
[0061] 話などでは、回線が比敦的空いている場合は音質の良い
[0062] 9600 ビット Z秒でも、回線が混んでくる 'と音質を多少犠
[0063] 牲にしてでも 4800 ビット/秒を使う方が回線の利用効率
[0064] が上がる。また音声情報を半導体メモリ等の記憶装置に
[0065] 記憶-させる場合には、音質を優先するか、記憶容量を優
[0066] 先するかによつて使用する情報量が違つてく.る。
[0067] 従来の音声合成装置は処理できる単位時間当りの情報
[0068] 量が固定されており、異なった情報量で表わされた音声
[0069] 情報を処理することができない。例えば 9600 ビット /秒
[0070] の情報量を扱う音声合成装置では 4800 ッ、、ト Z秒の情報
[0071] 量で表わされる音声情報を処理することができない。従
[0072] つて電話回線の混み具合によつて伝送する情報量を変え
[0073] るということができず、また記憶装置を用いる場合も音
[0074] 質を優先するか、音声の容量を優先するか応用先に応じ
[0075] 0]·.' Ι
[0076] . '·,'·,';:-〇 " て音声合成装置を選択しなければならなかった。
[0077] 本発明の目的は単位時間当りの情報量が異なる複数の方式の音声パラメータに基ずいて音声を合成することができる音声合成装置を得るものである。
[0078] 発明の開示
[0079] 本発明は、自然音声より一定時間間隔ごとに波形を切り出し、切り出されたそれぞれの波形から抽出された
[0080] 個の偏自己相関係数をもとに一定時間間隔でフィルタを変化させて音声を合成し出力する音声合成装置において、 1 時間間隔内に配分される個の偏自己相関係数を含む音声パラメータの量子化ビットを変えずに、偏自己相関係数を抽出する際の波形の切り出し間隔と合成の際の合成間隔を同時に可変することによつて単位時間あたりの合成のために使用する情報量を可変し、単位時間当り-の情報量が異なる複数の方式の音声パラメ—タに基ずいて、
[0081] -..それぞれの音声を合成できるようにしたものである。
[0082] '図面の簡単な説明
[0083] 第 1 図は本発明の音声合成装置の一実施例を示すブ口ック図、
[0084] 第 2 図は音声パラメータの入力タイミングを示すタイム線図、
[0085] 第 5図は本発明の音声合成装置の入力同期信号を発生するカウンタの一実施例を示すプロック図である。
[0086] 発明を実施するための最良の形態
[0087] 第 1 図は本発明の音声合成装置の一実施例を示すブロ
[0088] 0：： 1 ック図で、 1 は音声パラメ一タが記憶される記憶装置、
[0089] 2は記憶装置 1 から出力すべき音声パラメータのァ' ドレ
[0090] スを指定し、音声合成の開始及び終了、音声パラメ一タ
[0091] の転送レートの指定等を行なう制御装置である。記憶装
[0092] 置 1 は例えば半導体メモリで構成され、これに記憶され
[0093] る音声パラメータは音声の振幅を表わす振幅情報、声帯の基本振動周波数に相当するピッチ情報、 10個の偏自己
[0094] 相関係数が記憶される。'記憶装置 1 に記憶される情報は
[0095] 1 フレーム当り振幅情報 7 .ビット、ピッチ情報 7 ビット、
[0096] 10個の偏自己相関係数が 82ビット合計 90ビットの情報量
[0097] で記億されている。制御装置 2は例えばマイクロコンビ
[0098] ュ —タで構成され、 '會己憶装置 ¹ に記億されている音声パ
[0099] ラメータを記憶装置 1 から順次出力させるために、出力
[0100] ' すべき音声パラメータのアドレス指定、音声合成の開始
[0101] 及び終了等の制御信号を出力し、この制御信号は記憶装
[0102] 量 1 供給される。記憶装置 1 は制御装置 2の制御信号
[0103] に従つて記憶された音声パラメータを振幅，ピッチ，偏
[0104] 自己相関係数の順にシリアルに読み出し、これをインタ
[0105] フユース論理部 ⁵ へ供給する。インタフユース論理部 3
[0106] は制御装置 2から出力される制御指令信号を受信し、こ
[0107] の制洶指令信号に従つて記憶装置 1 か <洪裣される音声
[0108] パラメ一タから振幅情報，ピツチ情報，偏自己相関係数
[0109] を分 ¾ し、ピッチ情報から有声音か無声音かを判別して
[0110] 有声音の場合にはパルス発生器を駆動し、無声音の場合
[0111] には籍音発生器を駆動する。そしてさらに有声音の場合
[0112] 0:'/ΓΡΙ一にはピッチ惰報に基ずいてパルス発生器のパルスの周期を変える。インタフース論理部 3はさらに振幅情報に基ずいてパルス発生器あるいは雑音発生器の出力信号の振幅を制御し、これを音源信号として偏自己相関係数と共にデジタルフィルタ 4 に供給する。デジタルフィルタ 4 は ¹ 0段の格子型フィルタで構成され、 1 個の格子型フィルタは 2個の乗算器と， 1 個の減算器， 1個の加算器， 1 個の遅延回路及び 1 個の損失回路を備えている。そしてインタフ- ース論理部 ³から供給された "1 0個の倡自己相関係、数はデジタルフィルタ 4の ¹ 0段の格子型フィルタにそれぞれ供給され、デジタルフィルタ 4 で音源信号と偏自己相関係数が乗算され、デジタル音声符号が合成される.。デジタルフィルタ ⁴ で合成されたデジタル音声持号はデジタルアナログ変換器 5に供給され、デジタルァナログ変換器 5でデジタル音声符号はアナ口グ信号に変 -換される。そしてこのアナログ信号はスピーカ όに供給されて再生される。
[0113] 記憶装置 1 に記憶される音声パ 7 メータは 1 フレーム当り 90ビットで構成され、 1 フレームの時間は ² Om e c に選ばれている。従って. 1 秒間の音声を合成する場合、インタフユ一ス論理部 3 は 480 0 ビットの情燕を転送する。合成音の質を向上させるためには単位時間当りの情報量を多くすればよく、 ¹ フレーム当りの情報量 ⁹⁶ビットは変えずに 1 フレームの時間を ¹ O TTi e c に選ぶと、 1 秒当り 90 00 ビットの情報量となり合成音の質を向上させることができる。即ち 1 フレーム当りのビット数を変えずにフレーム周期を変えるだけで、単位時間当りの音声パラメ一タの転送量を変えることができる。
[0114] 第 2図は第 1 図に示す音声合成装置の音声パラメ —タの入力タイミングを示すタイムチャートであり、第 2図は 1 フレームを J ec とした場合、第 2図 J5は 1 フレームを l OTO ec とした場合である。いずれも 1 フレーム当りの情報量は％ビットであるが、第 2図 Sに示すよ' うにフレーム周期をにすると 1 秒間に転送する情報量は 2倍となる。従って電話回線の混雑の度合、必要とする合成音の質に応じて音声分析，音声合成の 1 フレームの時間を 20τπ·$· β にする力、、 10ms ec にする力還折すればよい。また音声合成装置も入力または記憶された音声パラメ一タのフレーム周期に合せて音声パラメータの取り込み周期が切換えられるようにすれば、 9<500ビット秒-の情報量と '⁴⁸00 ビット Z秒の情報量を切換えに処理することができる。
[0115] 記憶装置 1 には 1 フレーム当り 90 ビットで ¹ フレームの時間力 2OTO 0c の場合の音声パラメ一タと、 1 フレーム当り 90 ビットで ¹ フレームの時間が 1 Q s e c の場合の音声パラメ—タがそれぞれ一緒に記憶さか、あるいはいずれか一方の音声パラメ一タが選択されて記憶されている。また電話回籙等を通して他から音声パラメータが耘送されて釆る場合には、記憶装置 1 にはその時時に使 ¾される転送量、即ち 4800 ビット Z秒あるいは 9000 ビットノ秒の情報量で表わされた音声パラメ —タが記憶
[0116] される。
[0117] インタフニース論理部 3は記憶装置 1 から供給される
[0118] 音声パラメータの単位時間当りの転送量に応じて、情報
[0119] を取り込むタィミングを変えなければならない。インタ
[0120] フユース論理部 5は記憶装置 ¹ から音声パラメ一タを¹.²
[0121] ms e c で取り込み、この取り込み動作は第 2図に示すタ
[0122] ィムチヤ一トにお、、て 1 フレームの最後の 2.5OTJ e c の時
[0123] 間のうちに次のフレームの音声パラメ一タを取り込む。
[0124] 従って 1 OTO e c ある、、 2 O7n e c ごとに音声 'ラメ一タ
[0125] を取り込むための同期信号を発生する必要がある。カウ
[0126] ンタ部 17は、このインタフ - ース論理部 5 が情報を取り
[0127] 込むために必要入力タイミング信号を発生しており、
[0128] その入カタィミング信号は力ゥンタ部 "17の出力端子 "10か
[0129] らインタフエース論理部 5 に供給されている。カウンタ
[0130] --.部 17の出力信号である入力タイミング信号の周期はスィ
[0131] ツチ部¹²で切換えられ、音声パラメ一タの単位時間当り
[0132] の耘送量の違に応じて変化させられる。スィッチ部¹²は
[0133] 切換スィツチ 20を備え、その可動接点²¹はカウンタ部¹⁷
[0134] に接読され、 2個の固定接点²²， ²3のうち一方の固定接
[0135] 点²²は外部の電源 eeに接銃され、他方、の，定接点 ²5は
[0136] カウンタ部 7に接続されている。そして可動接点 2"!を一
[0137] 方の固定接点²²に接続するとカウンタ部¹⁷からは 10"we_C ごとに入力タイミング信号が出力され、 900Q ビッ卜 Z秒
[0138] の情報量に対処する。また可動接点²¹を他方の固定接点 ο:.ί ι . ²⁵に接続するとカウンタ部 ¹7からは 2 o _{J e c} ごとに入力タィミング信号が出力され 4S00 ビット Z秒の情報量に対処する。
[0139] このように音声パラメータのビット配分は全く変化なく、フレーム周期を変えることだけで音声パラメータの' 転送量が切換えられたことになる。音声パラメ一タが入力された後の動作は音声パラメ一タの値とは独立に、常に音声合成動作を行なっており、音声パラメータが入力されると、ディジタルフィルタ 4 の入力が新しい値となり、次々とディジタル音声符号を合成していく。ディジタル音声符号はディジタルアナ口グ変換器 5によりアナログ音声信号に変換される。このアナログ信号でスピ一力を駆動し、合成音声が出力される。 .
[0140] 第 5図は本発明の音声合成装置の力ゥンタ部の一実施例を示すブロック図である。第 3図において 7は 8段構
[0141] '- -成の-第 1 のバイナリカウンタで例えば 8個のフリッブフ
[0142] 口ッブ回路で構成されている。第 ¹ のフリップフロップ回路 71の一方の出力端子はいずれにも接続されず、他 ' 方の出力端子 Qは第 2のフリップフロップ回路 72の入力端子に接続され、さらに第 1 の N D回路 9 と第 2の
[0143] V >回路の入力端子に接続されてい ¾ また第 2 のフリップフロップ回路⁷²も同様にその他方の出力端子 Q 力' 第 3 のフリッブフロップ回路ァ5の入力端子/ πに接続され、さらに第 1 及び第 2 の N Ζ)回路 9 , 1 0のそれぞれの入力端子に接続されている。第 3のフリップフロッ
[0144] OMPI ブ回路 75及び第 5 のフリッブフロッブ回路 75も同様な接続がなされている。第 4のフリップフロッブ回路⁷⁴はその一方の出力端子 Qが第 1 の回路 9の入力端子に接続され、他方の出力端子が第 2 の N 回路 ¹0の入力端子に接続されている。第 ό のフリッブフ口ッブ回路 70の一方の出力端子 Qは第 2 の A N D回路 ¹0の入力端子に接続され、他方の出力端子 Qは第 1 の N i)回路 9 の入力端子に接続されている。また第 7のフリップフロッブ回路の一方の出力端子 Qは第 1 及び第 2の回路 9 , "10のそれぞれの入力端子に接続され、さらに第 δ のフリップフロッブ回路ァ8の一方の出力端子 Qは第 1 の ^ V i)回路の入力端子に接続され、他方の出力端子は第.² の回路 0の入力端牛に接続されている。第 ¹ の iV )回路 9の出力端子は第 1 から第 8のフリップフ α ッブ回路 7¹— 78のそれぞれのリセット端子に接続されている。また第 1 のフリッブフ口ップ回路⁷¹の入力端子は第 1 のク α ックパルス発生器 8に接続されている _c
[0145] 11は 3段構成の第 2のバイナリカウンタで 5個のフリッブフロッブ回路 ¹¹¹一 "M5で構成され、第 1 段目のフリップフロッブ回路 111 の入力端子は^ f iV D回路 9、の出力端子に接銃され、一方の出力端子 Qは'、第の V 回路 ¹5の入力铠子に接続され、他方の出力端子は第 2段目のフリップフロップ回路 ¹ 2の入力端子に接続されている。また第 ²段目のフリップフロップ回路 "2 も同様にその一方の出力端子 Qが第 5 の A N D回路の入力端子に接続され、他方の出力端子は第 5段目のフリップフロッブ回路 ¹¹3 の人力端子/ に接続されている。第 5段目のフリッブフ口ジブ回路 ¹¹3の一方の出力端子 Qは切換スィツチ 20の他方の固定接点 25に接続さ 'れている。第
[0146] 1 の A Ν Ζ>回路 9の出力端子はさらに S フリッブフ口ップ回路のセット入力端子 5に接続され、フリツブフ σ ッブ回路 ¹5のリセット入力端子は第 2の N D回路
[0147] 10の出力端子に接続されている。フリップフロップ回路
[0148] 1⁵の出力端 ίは第 5の V D回路¹⁵の入力端子に接続され、第 3の ^ N 回路¹⁵の他の入力端子はィンタフ - 一
[0149] ス論理部 3の内部に設けられた第 2のクロックパルス発
[0150] 生器 4に接続され、またフリップフロッブ回路¹⁵の出力端子は出力端子 ¹όに接続されている。
[0151] このような回路において、まず音声パラメータの転送
[0152] 量が 4S00 ビット/秒の場合について説明する。この場合
[0153] にはスイッチ 20の可動接点 21は他方の固定接点 23に接続されている。そして第 1 のカウンタ 7はクロックパルス発生器 8のクロックパルスを順次力ゥントし、 200個のク口ックパルスをカウントすると i)回路 9 の入力端 ' 子に接続されている 8個のフリッブフ口ッブ回路 71— 78 の出力端子は全てハイレベルとなって ¹ ^力する。この結杲 »回路 9の出力はハイレベルとなって 1 を出- 力しカウンタ 7をリセッ卜する。即ち N 回路 9は力
[0154] ゥンタ 7 力ノ、 'ノレス発生器 8 のクロックパノレスを 200個力ゥントするごとに 1 出力を出す。これは時間間隔にして
[0155] ΟΜ Ι_ 2.5 mi ec ごとに ^ N )回路 ⁹から 1 出力が出力されるこ
[0156] とになる。第 2のカウンタ Mは N »回路 9の出力を力
[0157] ゥントし、 N D回路 9 の出力を 8個カウントすると 5
[0158] 個のフリッブフ口ッブ ¹¹1一 U 5の Q出力端子はハイレベルとなって 1 を出力する。即ち 2.5 7^ ec ごとに出力され
[0159] る N D回路 ⁹ の出力を 8個カウントして ²0r^ec にな
[0160] ると第 5 の回路にハイレベルの信号を供給する。
[0161] ま†:R S フリッブフ口ッブ回路のセット入力端子には
[0162] D回路 9 の出力信号が供給されており、フリツブフ
[0163] ロッブ回路¹⁵は回路 9 の出力信号でセット状態と
[0164] なり、その出力端子はハイレベルとなって ¹ の出力信号
[0165] を出力する。また第 5の V D回路¹⁵の入力端子にはク
[0166] 口ックパノレス発生器 14のクロックパルスが供給されてい
[0167] る。従って第 3の ^ 回路 ¹5の 5個の入力端子が全て
[0168] ハイレベルになる時点は力ゥンタ ¹¹の第 ⁵段目のフリッ
[0169] ブフロッブ回路 ¹¹3の出力端子 Qがハイレベルとなつた
[0170] 時、即ちカウンタ部 ¹7が動作を開始してから 20 ^e e 後
[0171] となる。カウンタ 11 の 5 個のフリッブフロッブ 111— 115
[0172] は 8個のパルスをカウントするとリセットきれて再び 1
[0173] 力らパルスをカウントするため、第 5の V D回路の全
[0174] ての入力端子がハイレベルとなるのは ² a7 ^e c ごととな
[0175] り、この時 N D回路 "15出力端子 10からハイレベル即ち
[0176] 1 の出力が出力される。出力端子 ¹<Sに現われた信号は第
[0177] 1 図のインタフ - —ス論理部 3 に供給され、インタフユ —ス論理部 3は出力端子 ¹όに 1 出力が現われている期間
[0178] 〇M I <：',, ' に記憶装置 1 から音声パラメ一タを取り込む。
[0179] 第 2 の A N D回路 ¹0の全ての入力端子は、第 1 のカウ
[0180] ンタ 7力ノノレス勞生器 8のク口ックノノレスを 9ό個カウン
[0181] トした時、即ちカウンタ 7がカウントを開始してから¹ -²
[0182] msec 経過した時にハイレベルとなり、その出力端子に
[0183] 1 の信号を出力する。そして v i)回路 10のハイレベル
[0184] の出力は S フリップフ口ッブ回路 13のリセット入力端
[0185] 子に供給されフリッブフ口ップ回路¹⁵をリセット状態
[0186] にする。従つてフリップフ口ッブ回路 15は N X»回路 9
[0187] の出力でセット状態になつてから ¹.2mj e c 経過後にリセ
[0188] ット状態になり、その出力は口一レベルの 0出力となる, これにより ^ V 回路 15の出力は 0 となり、インタフ- • —ス論理部 5の情報取り込み動作は終了する。従ってィ
[0189] ンタフユ一ス論理部 5 A N D回路 15の出力がハイレべ
[0190] ソレとなって、る 1.2 1 β e の期曰 3にのノソレス信号
[0191] -を ⁹ό-個取り込み、これを音声パラメータを取り込む同期
[0192] 信号とする。
[0193] 次に音声パラメ一タの'転送量が 9600 ビット Z秒の場合
[0194] について説明する。この場合には切換スィッチ ²0の可動
[0195] 接点²¹は一方の固定接点 22に接続される。固定接点²²に
[0196] ヽ、
[0197] は電源より正電圧が供給されており、こ )電圧はスイツ
[0198] チ ²0を通して _D回路¹⁵の入力端子に供給される。従つて A N D回路 ¹⁵の全ての入力端子がハイレベルとなる
[0199] 時は力ゥンタ 11の第 1 及び第 2のフリッブフ口ッブ 111 ，
[0200] 112 の出力端子 Qがそれぞれハイレベルとなって 1 信号
[0201] VII〇が出力された時となる。即ち回路 9の出力信号を
[0202] 2. m s e c おきに数えて第 4番目と第 8番目の期間に Λ
[0203] D回路 15の出力端子に 1 の信号が出力される。出力端
[0204] 子 ¹ όがハイレベルになる時間間隔は 1 0 _e e となり、ィ
[0205] ンタフユ一ス論理部 S は 1 Q m s e c間隔で 1 フレーム当り
[0206] 96 ビットの音声パラメータを取り込む。
[0207] このように 1 フレーム分の音声パラメータを 90 ビット
[0208] にし、 1 フレームを ²0 ミリ秒とすると 1 秒間の音声を合
[0209] 成するための音声パラメ一タの転量は 4800 ビット/秒
[0210] であるが、この "I フレームの周期をの 10 ミリ秒に切
[0211] 換えると 1 フレームの情報量は同じ 90ビットであつても、
[0212] 1秒間に 9600 ビットの音声パラメ一タを転送することが
[0213] できる。即ち音声パラメ —タのビット配分は'全く変化な
[0214] く、フレーム周期を変えることだけで音声パラメータの
[0215] 転送量を切換えることができる。
[0216] - 産業上の利用可能性
[0217] 本発明の音声合成装置は電話回線を利用して天気予報
[0218] 等の情報を連続して音声で提供する案内装置、学習問題
[0219] を音声で出題する学習器等に利用できる。
[0220] c- · Ι ,

权利要求:
Claims
請求の範囲
自然音声より一定時間間隔ごとに波形を切り出し、切り出されたそれぞれの波形から抽出された個の偏自己相関係数をもとに一定時間間隔でフィルタを変化させて音声を合成し出力する音声合成装置において、個の偏自己相関係数を含む音声パラメータの量子化ビット配分を変えずに、偏自己相関係数を抽出する際の波形の切り出し間隔と合成の際の間隔を同時に可変することに'よつて単位時間あたりの合成のために使用する情報量を可変することを特徵とする音声合成装置, 前記合成の時間間隔と音声パラメータを取り込む時間間隔を独立に指定する力ゥンタを傭えたことを特徵とする特許請求の範囲第 1項に記載された音声'合成装

类似技术:

公开号 | 公开日 | 专利标题

US8005555B2|2011-08-23|Audio signal processing apparatus

US7119268B2|2006-10-10|Portable telephony apparatus with music tone generator

US6678652B2|2004-01-13|Audio signal processing apparatus

US4624012A|1986-11-18|Method and apparatus for converting voice characteristics of synthesized speech

US5809472A|1998-09-15|Digital audio data transmission system based on the information content of an audio signal

CN100349228C|2007-11-14|在存储媒体上记录或者重放的方法和装置

US4020282A|1977-04-26|High density data processing system

US6349277B1|2002-02-19|Method and system for analyzing voices

CA1127765A|1982-07-13|Speech analyzer comprising circuits forcalculating autocorrelation coefficientsforwardly and backwardly

US4916996A|1990-04-17|Musical tone generating apparatus with reduced data storage requirements

US4720861A|1988-01-19|Digital speech coding circuit

Atal1983|Efficient coding of LPC parameters by temporal decomposition

KR100564057B1|2007-03-21|엔코딩시스템및방법,디코딩시스템및방법,엔코딩데이타기록장치및방법과,엔코딩데이타전송장치및방법

KR100472904B1|2005-03-08|음악 부분을 자동으로 선별해 저장하는 디지털 음악 재생장치 및 그 방법

CA1138580A|1982-12-28|Digital intercept recorder/announcer system

US4473904A|1984-09-25|Speech information transmission method and system

US4121058A|1978-10-17|Voice processor

US5245667A|1993-09-14|Method and structure for synchronizing multiple, independently generated digital audio signals

US4809271A|1989-02-28|Voice and data multiplexer system

CA1181857A|1985-01-29|Silence editing speech processor

US5915237A|1999-06-22|Representing speech using MIDI

US6839446B2|2005-01-04|Hearing aid with sound replay capability

EP0205200A1|1986-12-17|Verfahren zur Übertragung von Audio-Information und Zusatzinformation in digitaler Form

US6734351B2|2004-05-11|Apparatus and method for sampling and storing audio information and apparatus for outputting audio information

CA1295421C|1992-02-04|Amplitude enhanced sampled clipped speech encoder and decoder

同族专利:

公开号 | 公开日

EP0045813A1|1982-02-17|

JPS5913758B2|1984-03-31|

EP0045813B1|1985-07-03|

JPS56117294A|1981-09-14|

EP0045813A4|1982-07-13|

US4491958A|1985-01-01|

引用文献:

公开号 | 申请日 | 公开日 | 申请人 | 专利标题

法律状态:
1981-09-03| AK| Designated states|Designated state(s): US |

1981-09-03| AL| Designated countries for regional patents|Designated state(s): DE FR GB NL |

1981-09-17| WWE| Wipo information: entry into national phase|Ref document number: 1981900494 Country of ref document: EP |

1982-02-17| WWP| Wipo information: published in national office|Ref document number: 1981900494 Country of ref document: EP |

1985-07-03| WWG| Wipo information: grant in national office|Ref document number: 1981900494 Country of ref document: EP |

优先权:

申请号 | 申请日 | 专利标题

JP80/20597||1980-02-22||

JP2059780A|JPS5913758B2|1980-02-22|1980-02-22||DE8181900494T| DE3171171D1|1980-02-22|1981-02-17|Speech synthesis unit|

[返回顶部]